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摘要 : [目的 /意义 ] 印 本 馆藏 大 规模 数字 化 是 数字 图 书馆 发 展 的 必然 之 举 ， 它 既 无 限 地 扩大 了 图 
书馆 服务 的 深度 和 广度 ， 同 时 又 极 大 地 推动 了 学 术 交 流 和 学 术 研 究 的 发 展 进 步 。[ 方 法 / 过程] 从 发 展 缘 
起 、 环 境 因素 、 发 展现 状 和 存在 的 问题 等 方面 对 全 球 印 本 馆藏 大 规模 数字 化 运动 进行 分 析 研 究 ， 并 以 美 
HathiTrust 项 目 作 为 实证 分 析 案 列 。[ 结果 / 结论 ] 确立 大 规模 数字 化 原则 、 立 足 合 理 使 用 原则 解决 版 权 
问题 、 建 立 多 级 多 维度 合作 框架 是 促进 印 本 馆藏 大 规模 数字 化 长 足 发 展 的 重要 举措 。 
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台 于 2004 年 的 Google 图 书 计 划 ， 掀 起 了 
印 本 馆藏 大 规模 数字 化 运动 的 浪潮 。2008 年 
HathiTrust 宣告 成 立 ， 把 这 一 运动 推 向 了 高 潮 。 
2014 年 2 月 ，HathiTrust 数字 图 书馆 里 的 藏书 突 
破 了 1 100 万 册 门 ， 迎 来 了 HathiTrust 发 展 史上 


4 


过 最 终 用 户 的 使 用 来 实现 其 价值 。 对 于 任何 一 
个 想 要 阅读 或 者 使 用 资源 的 人 来 说 ， 总 是 希望 
能 更 快 、 更 便捷 、 不 受 时空 限 制 、 完 全 无 障碍 
地 获取 到 其 所 需 ， 这 也 是 图 书馆 一 直 所 追寻 的 
终极 目标 。 如 果 最 终 用 户 的 数量 达到 极致 ， 也 


的 一 个 里 程 碑 ，2017 年 2 月 ，HathiTrust 的 馆藏 
突破 了 1 500 万 册 中， 实现 了 新 的 飞跃 。 星 星之 
火 已 经 煤 原 ， 全 球 图 书馆 开展 的 数字 化 运动 极 
大 地 推动 了 学 术 交 流 和 学 术 研 究 的 发 展 进步 。 


@O 络 起 


传统 的 印 本 资源 通常 要 经 过 出 版 、 传 播 和 
获取 三 个 环节 后 才能 到 达 最 终 用 户 手 上 ， 并 通 


就 是 说 ， 印 本 资源 被 尽 可 能 多 的 人 使 用 ， 其 价 
值 将 得 到 最 大 程度 的 彰显 。 而 印 本 资源 的 大 规 
模 数 字 化 正 是 实现 这 一 目标 的 重要 手段 ， 它 使 
得 印 本 资源 的 使 用 价值 最 大 化 ， 极 大 地 推动 了 
人 类 文明 和 知识 的 传播 ， 并 促进 了 学 术 交 流 和 
学 术 研 究 的 深度 和 广度 发 展 。 

2004 年 12 月 ，Google 宣告 启 动 Google 
Print 图 书馆 计划 ， 与 哈佛 大 学 、 密 西根 大 学 、 纽 
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约 公 共 图 书馆 、 牛 津 大 学 和 斯 坦 福 大 学 等 几 所 
超大 型 图 书馆 进行 合作 ， 这 些 馆 馆藏 量 估计 超 
过 1 500 万 册 口 。 双 方 达成 协议 : 由 Google 出 
资 提供 技术 设备 和 对 馆藏 资源 进行 扫描 和 编 
目 ， 使 全 世界 的 读者 可 从 Google 网 站 上 搜索 读 
取 资 源 全 文 的 片段 、 摘 要 及 其 馆藏 和 市 场 信息 。 
几 年 后 ， 谷 歌 已 经 扫描 了 近 千 万 册 书 籍 供 网 上 
搜索 外。 

2008 年 4 月 ， 和 荷兰 图 书馆 首开 先河 ， 与 版 
权 所 有 者 签署 意向 宣言 ， 就 遗产 收集 的 数字 化 
和 可 获取 性 达成 共识 ， 这 是 全 球 第 一 份 图 书馆 
与 版 权 所 有 者 签订 的 此 种 类 型 的 协议 ， 其 核心 
内 容 在 于 图 书馆 可 得 到 版 权 所 有 者 的 授权 ， 数 
字 化 其 作品 并 在 用 于 教学 或 科研 目的 前 提 下 在 
本 馆 馆 舍 内 供 公 共 获 取 外。 这 有 力 地 推动 了 传 
统 馆藏 大 规模 数字 化 运动 的 开展 。 

2008 年 10 月 ，HathiTrust 宣告 诞生 ， 它 是 
由 美国 机 构 合作 委员 会 (CIC〉 图 书馆 联盟 和 加 
州 大 学 图 书馆 联盟 共同 创建 的 共享 数字 仓储 项 
目 ， 将 其 成 员 馆 所 收藏 的 印刷 型 文献 进行 数字 
化 ， 并 统一 保存 中。 至 此 ， 印 本 馆藏 的 大 规模 
数字 化 运动 莲 勃 开展 起 来 。 


@ 大 规模 数字 化 的 环境 因素 


2.1 数字 图 书馆 的 大 发 展 

随 着 数字 化 和 网 络 化 的 发 展 ， 越 来 越 多 
的 资源 以 网 络 为 载体 ， 网 络 数字 资源 跨越 时 空 
的 方便 获取 性 ， 使 得 在 线 阅 读 成 为 新 型 阅读 方 
式 ， 并 日 益 成 为 主流 。 用 户 不 断 变化 的 阅读 习 
惯 和 行为 模式 使 得 图 书馆 必须 一 直 在 新 技术 和 
用 户 体验 方面 保持 领先 优势 ， 这 是 数字 图 书馆 
发 展 的 原动力 ， 对 数字 馆藏 的 需求 增加 以 及 移 
动 服务 的 新 需求 ， 使 得 传统 纸 本 馆藏 很 难 再 满 
足 用 户 在 线 阅读 需求 ， 大 规模 数字 化 成 为 数字 
图 书馆 发 展 的 重要 组 成 部 分 ， 实 现 图 书馆 最 大 
化 提供 馆藏 和 服务 的 在 线 利 用 。 同 时 大 规模 数 
字 化 客观 上 减少 了 对 空间 和 人 力 的 需求 ， 从 而 
降低 了 馆藏 管理 成 本 。 

此 外 ， 随 着 移动 技术 的 日 新 月 异 ， 移 动 设 
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备 正 改变 着 人 们 传递 和 获取 信息 的 方式 ， 移 动 
阅读 日 渐 兴 起 ， 由 于 其 具有 阅读 工作 的 便携 性 
和 可 移动 性 、 阅 读 内 容 的 可 检索 性 和 及 时 获取 
性 、 阅 读 行 为 的 持久 性 和 连续 性 等 优势 中， 和 逐 
渐 成 为 一 种 主流 阅读 模式 ， 这 对 数字 图 书馆 服 
务 内 容 的 多 样 性 和 丰富 性 提出 了 更 高 的 要 求 。 
为 适应 移动 环境 的 发 展 变化 ， 图 书馆 开始 利用 
移动 设备 来 提供 服务 和 内 容 传递 ， 用 户 可 以 借 
助手 机 来 方便 地 利用 数字 化 后 的 印 本 资源 。 而 
大 数据 时 代 的 兴起 又 对 图 书馆 的 数字 化 发 展 提 
出 了 更 迫切 的 要 求 。 

2.2 开放 获取 运动 的 大 发 展 

开放 获取 运动 的 理念 就 在 于 要 实现 研究 成 
果 能 被 任何 想 要 阅读 和 使 用 的 人 无 障碍 地 任意 
获取 ， 从 而 使 得 科研 成 果 的 社会 、 经 济 和 文化 
效益 得 到 最 大 程度 地 发 挥 。 资 源 的 开放 、 透 明 
和 易于 获取 已 逐渐 成 为 一 种 价值 观念 。 

2007 年 12 月 美国 政府 通过 了 NIH 实行 强 
制 性 开放 存 取 的 法 律 条 款 ，2012 年 美国 联邦 研 
究 成 果 公 共 获 取 提 案 (FRPAA) 再 次 被 提交 至 众 
议院 和 参议 院 ， 将 强制 开发 获取 的 领域 扩大 到 
所 有 联邦 机 构 ， 欧 洲 研 究 型 大 学 联盟 也 发 布 了 
《开放 人 研究 数据 》 和 《研究 出 版 物 的 开放 获取 》 的 
声明 [sl 

作为 全 球 最 大 的 科研 资助 机 构 之 一 的 英国 
惠 康 基金 会 一 直 是 开放 获取 的 积极 倡导 者 和 领 
跑 者 ， 早 在 2006 年 就 要 求 其 资助 的 原创 研究 论 
文 在 正式 出 版 后 6 个 月 内 存储 到 Europe PubMed 
Central 中 开放 获取 ，2012 年 推出 了 更 为 强硬 的 
存储 政策 ， 要 求 2013 年 10 月 起 资助 的 新 项 目 
以 及 2014 年 10 月 起 所 有 被 资助 项 目 所 出 版 的 
专著 或 图 书 章 节 实 行 与 论文 相同 的 开放 获取 政 
策 趾 。 强 制 开放 获取 政策 极 大 地 推动 了 开放 获 
取 的 发 展 。 

开放 获取 运动 对 学 术 人 研究 领域 所 产生 的 影 
响 是 前 所 未 有 的 ， 它 促进 了 学 术 成 果 数 字 化 的 
发 展 ， 同 时 数字 化 的 发 展 又 进一步 推动 开放 获 
取 运 动 的 快速 进步 ， 为 全 世界 的 用 户 提供 了 更 
为 广泛 而 深入 的 文献 资源 的 公开 获取 ， 而 印 本 
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馆藏 的 数字 化 是 图 书馆 顺应 开放 获取 环境 下 加 
强 自身 核心 竞争 力 的 必然 选择 。 
2.3 高 等 教育 的 发 展 趋势 

高 等 教育 正面 临 前 所 未 有 的 机 遇 和 挑战 , 进 
行 着 重大 的 变革 ， 传 统 的 教育 体制 和 模式 日 益 
受到 新 技术 发 展 的 挑战 ， 高 等 教育 机 构 之 间 的 
莞 争 也 愈 发 激烈 ， 并 日 趋向 国际 化 方向 快速 发 
展 。 欧 美国 家 的 大 学 纷纷 在 亚洲 和 中 东 地 区 建 
立 分 校 ， 如 纽约 大 学 在 中 国 和 阿联酋 建立 分 
校 , 诺丁汉 大 学 在 中 国 和 马来西亚 建立 分 校 ， 耶 
鲁 大 学 在 新 加 坡 建立 分 校 ， 跨 洲 合作 办 学 和 授 
予 学 位 的 机 构 更 是 层出不穷 。 

与 此 同时 ， 由 于 网 络 和 平板 电脑 的 大 量 应 
用 ， 在 线 教学 和 学 习 普 及 起 来 ， 而 大 规模 开放 网 
络 课程 MOOC) 异军突起 ， 凭 借 其 大 量 免 费 内 
容 和 高 水 平 的 教学 越 来 越 受 到 欢迎 ， 并 作为 传统 
大 学 课程 的 蔡 代 和 补充 逐渐 获得 广泛 应 用 "1。 
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从 图 1 还 能 看 出 ，HathiTrust 的 馆藏 在 2012 
年 后 增长 势头 减缓 ， 这 是 由 于 Google 放 慢 了 图 
书 扫描 工作 ， 这 反映 了 该 项 目的 自然 成 熟 过 程 。 
拟 扫 描 的 图 书 存在 重复 的 可 能 增加 ， 因 此 采集 
量 减少 了 ， 同 时 有 些 机 构 打 破 与 谷歌 的 常规 协 
议 ， 只 扫描 特色 馆藏 ， 如 德 克 萨 斯 大 学 奥斯汀 
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高 等 教育 和 学 术 人 研究 的 变革 无 疑 会 对 图 书 
馆 的 以 下 儿 个 方面 产生 重大 影响 : 馆藏 的 建设 
和 发 展 、 资 源 的 获取 和 保存 以 及 不 断 扩展 用 户 
的 服务 等 "1。 把 印 本 馆藏 包括 各 种 特色 和 珍稀 
馆藏 数字 化 ， 可 以 为 教学 和 科研 提供 更 为 丰富 
的 网 络 资源 ， 以 满足 其 所 属 机 构 在 线 教学 和 学 
术 创新 的 需要 ， 增 强 竞 争 力 。 


全 发 展现 状 及 存在 的 问题 


3.1 发 展现 状 

截至 到 2012 年 3 月 ，Google 已 对 2 000 多 
万 有 册 图 书 进行 了 数字 化 路 ， 而 HathiTrust 经 过 5 
年 多 的 发 展 ， 其 馆藏 已 达到 11 262 697 册 中 。 
图 1 是 HathiTrust 2009 年 6 月 至 2014 年 6 月 5 
年 期 间 数字 馆藏 年 度 统计 o0， 从 图 1 中 可 以 看 
出 ，5 年 期 间 其 馆藏 增长 了 240%， 平 均 每 年 增 
幅 接近 50%， 增 速 是 很 快 的。 


11 262697 
10 748067 


10 408 905 


2012.6 2013.6 


2014.6 年 代 


图 1 HathiTrust 2009.6-2014.6 数字 馆藏 年 度 统计 


分 校 只 扫描 其 拉丁 美洲 馆藏 叫 。 

与 此 同时 ，HathiTrust 对 进入 公共 领域 的 馆 
藏 建设 也 非常 重视 ,馆藏 量 逐 年 不 断 增长 ， 在 总 
馆藏 中 的 比重 越 来 越 大 ， 这 点 从 表 1“HathiTrust 
2009.6-2014.6 进入 公共 领域 的 馆藏 统计 ”09 可 以 
看 出 ， 和 截至 到 2014 年 6 月 ， 有 34% 的 馆藏 可 以 
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免费 获取 全 文 ， 且 是 面向 全 球 开放 的 。 到 2017 
年 2 月 有 5 811 123 册 进 入 公共 领域 ， 占 15 
101 537 册 总 馆藏 的 38.5%051。 


表 1 Hathitrust 2009.6-2014.6 进入 公共 领域 的 馆藏 
统计 ( 单位 : 册 ) 
年 度 总 馆藏 公共 领域 馆藏 占 比 


2009.6 3 310 827 534 338 16% 
2010.6 6 193 386 1 208 351 20% 
2011.6 8 854 324 2413 921 27% 
2012.6 10 408 905 3 105 587 29% 
2013.6 10 748 067 3 405 432 31% 
2014.6 11 262 697 3 848 472 34% 


HathiTrust 发 布 的 2014 年 6 月 统计 报告 
还 显示 ， 密 西根 大 学 图 书馆 、 加 州 大 学 图 书馆 
扫描 的 馆藏 量 位 居 第 一 和 第 二 ， 分 别 为 4 689 
072 册 和 3 520 634 册 WI， 分 别 占 HathiTrust 总 
馆藏 的 41.6% 和 31.3%， 合 计 所 占 比 例 达 到 
73%， 可 见 这 两 个 图 书馆 是 HathiTrust 最 主要 的 
贡献 者 。 

HathiTrust 很 多 成 员 馆 都 提供 数字 馆藏 打印 
服务 ， 如 加 州 大 学 图 书馆 将 其 数字 馆藏 已 进入 
公共 领域 的 图 书 向 读者 提供 重印 本 服务 ， 并 通 
过 亚马逊 提供 快递 服务 。 而 Google 更 是 推出 随 
用 随 印 服务 ， 它 设计 出 一 款 快速 印 书 机 ， 读 者 
只 要 付 大 约 8 美元 就 能 在 5 到 10 分 钟 内 得 到 一 
本 装订 好 的 简装 本 外 ， 既 经 济 又 高 效 。 

HathiTrust 不 断 发 展 成 员 馆 ， 让 成 员 馆 
把 本 地 数字 化 馆藏 存 入 HathiTrust 里 ， 这 也 
是 HathiTrust 馆藏 增长 迅速 的 原因 之 一 ， 同 时 
HathiTrust 还 不 断 开 发 新 的 工具 (如 SIP) 以 使 各 
成 员 馆 简 化 和 加 速 存 储 过 程 。 

欧洲 也 开展 了 大 量 的 数字 图 书馆 建设 项 
目 ， 如 大 英 图 书馆 实施 了 大 量 的 数字 化 项 目 来 
将 本 馆 的 文化 遗产 数字 化 ， 使 大 量 珍 贵 的 手 
稿 既 有 了 数字 化 替代 馆藏 ， 又 能 被 公众 广泛 
获取 利用 。 该 馆 近 期 还 参与 了 一 些 全 球 性 的 
大 规模 数字 化 项 目 ， 包 括 Google 图 书 项 目 和 
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brightsolid 报纸 数字 化 项 目 "。 

我 国 的 数字 化 建设 主要 以 特色 馆藏 为 主 , 特 
别 是 中 文 古籍 的 数字 化 取得 了 很 大 的 进展 。 据 
统计 ，2012 年 我 国 公 藏 机 构 已 拥有 超过 20 亿 
字 的 数字 化 文本 格式 的 古籍 ""， 同 时 国际 合作 
项 目 日 益 增 多 ， 其 中 国家 图 书馆 承担 的 最 多 。 
高 校 的 国际 合作 项 目 最 具 代 表 性 的 是 CADAL 
(大 学 数字 图 书馆 国际 合作 计划 ) 。 截 至 2014 
年 2 月 ，CADAL 馆藏 量 为 2748 688 册 / 件 ， 数 
字 化 的 文献 包括 古籍 、 图 书 、 期 刊 、 学 位 论文 
等 。 其 中 中 文 图 书 有 1 130 595 册 〈 含 古籍 236 
581 册 ) ， 外 文 图 书 767 059 册 中 ， 是 目前 国内 
图 书馆 对 印 本 图 书 进行 大 规模 数字 化 的 代表 项 
目 , 任何 用 户 通 过 注册 就 可 以 免费 阅读 和 打印 。 
3.2 存在 的 问题 

印 本 馆藏 大 规模 数字 化 在 快速 发 展 过 程 中 
历经 了 重重 困难 ， 存 在 的 以 下 问题 成 为 其 发 展 
的 障碍 。 
3.2.1 版 权 问题 

Google 图 书 计划 从 实施 一 开始 就 一 直 备 
受 争 议 ， 而 所 有 的 争议 都 和 版 权 有 关 ， 大 规模 
数字 化 的 发 展 史 也 是 一 部 Google 的 诉讼 史 。 
从 2005 年 美国 作家 同业 协会 和 出 版 业 协会 把 
谷歌 告 上 法 庭 开始 ，Googtle 的 侵权 官司 就 一 直 
没有 停止 过 ， 起 诉 Google 的 行业 组 织 和 出 版 
商 越 来 越 多 。2011 年 3 月， 美国 法 院 驳回 了 
Google 图 书 “ 和 人 解 协议 ”J， 给 大 规模 数字 化 的 
发 展 蒙 上 了 阴影 ， 图 书馆 版 权 联盟 就 此 发 表 声 
明 :“ 这 项 裁决 清楚 地 表明 ， 现 行 版 权 法 仍然 对 
图 书馆 以 及 其 他 有 兴趣 从 事 大 规模 数字 化 项 目 
的 合作 者 造成 重大 阻碍 ”0。HathiTrust 也 受到 
版 权 问题 困扰 ， 美 国 作家 协会 起 诉 其 数字 图 书 
馆 违 反 了 美国 版 权 法 。2013 年 向 公众 推出 在 线 
免费 获取 的 美国 数字 公共 图 书馆 (Digital Public 
Library of America, DPLA) 也 指出 版 权 问题 是 
其 目前 所 面临 的 最 大 问题 之 一 ， 可 见 ， 版 权 问 
题 始终 是 印 本 资源 大 规模 数字 化 的 一 大 障碍 。 
3.2.2 长 期 管理 与 保存 

数据 的 管理 和 保存 是 所 有 数字 化 项 目 最 重 
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要 也 是 最 困难 的 工作 。 通 常数 据 的 存储 包括 书 
目 数据 和 全 文 数据 两 个 部 分 。 数 字 资 源 不 同 于 
实体 资源 ， 如 果 没 有 得 到 特别 的 保护 ， 其 生命 
周期 是 很 短暂 的 。 随 着 数字 图 书馆 发 展 的 日 益 
成 熟 ， 数 字 馆 藏 的 数量 不 断 增 长 ， 其 长 期 管理 
和 保存 的 问题 越 来 越 突出 ， 特 别 是 个 体 图 书馆 
在 长 期 保存 问题 上 的 认识 和 规划 存在 较 大 的 不 
足 ， 这 对 本 地 数字 馆藏 的 可 持续 性 发 展 极为 不 
利 。 图 书馆 在 创建 新 资源 上 的 投入 要 远 远 多 于 
维护 或 优化 其 已 创建 的 资源 ， 即 一 旦 将 馆藏 数 
字 化 ， 往 往 基本 上 不 主动 对 其 进行 管理 中。 

Portico 和 康 奈 尔 大 学 图 书馆 的 报告 表明 , 大 
多 数 文化 遗产 机 构 仅 仅 开 始 意识 到 其 在 建立 数 
字 馆 藏 方面 的 大 量 投资 必须 能 够 保证 在 其 生命 
周期 内 保护 这 些 内 容 并 提供 相应 的 基础 设施 六。 
OCLC 对 美国 和 加 拿 大 169 个 研究 型 图 书馆 特 
色 馆 藏 数字 化 的 调研 显示 ， 有 97% 的 图 书馆 已 
经 完成 一 个 或 多 个 数字 化 项 目 。 而 缺少 资金 、 专 
业 知 识 和 行政 支持 被 认为 是 其 进行 数字 馆藏 管 
理 与 保存 的 最 大 障碍 请。 
3.2.3 元 数据 互 操 作 性 问题 

元 数据 是 有 效 组 织 和 揭示 数字 资源 必 不 
可 少 的 元 素 ， 由 于 从 事 大 规模 数字 化 项 目 
的 机 构 各 种 各 样 ， 以 及 数字 资源 的 内 容 和 形 
式 也 是 丰富 多 彩 ， 造 成 了 多 种 元 数据 标准 并 
存 的 局 面 ， 以 及 对 于 元 数据 的 收集 和 整理 困 
难 重 重 ， 使 得 数字 资源 的 整合 利用 以 满足 
用 户 统一 检索 的 需求 充满 了 挑战 ， 这 必然 
制约 了 数字 图 书馆 的 可 持续 性 发 展 。 解 决 
这 一 问题 的 关键 就 是 实现 元 数据 的 互 操 作 
性 。 有 学 者 对 大 学 数字 图 书馆 国际 合作 计划 
(CADAL)、 中 国 国家 图 书馆 数字 图 书馆 工程 
( 数 图 工程 )、 合 歌 图 书 (Google Book)、 欧 
洲 数 字 图 书馆 (Europeana)、 开 放 图 书馆 
(Open Library)、HaithTrust、 加 州 数字 图 书 
馆 (CDL)、 美 国 记忆 (AM) 等 国内 外 知名 的 大 
型 数字 化 项 目的 元 数据 互 操 作 性 进行 了 调研 
叶 ， 从 中 可 以 看 出 取得 了 一 定 的 进展 ， 但 要 
从 根本 上 解决 这 一 问题 ,还 有 很 长 的 路 要 走 。 
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大 规模 数字 化 历经 10 余年 的 发 展 ， 取 得 的 
成 就 是 举世 瞩目 的 ， 它 不 仅 推动 了 数字 图 书馆 
的 发 展 ， 同 时 促进 了 学 术 研 究 和 学 术 交 流 广 度 
和 深度 的 进一步 扩展 ， 特 别 在 对 知识 的 整合 与 
创新 上 成 效 显 著 。 但 其 发 展 过 程 中 遇 到 的 困难 
和 存在 的 问题 成 为 制约 其 发 展 的 障碍 ， 如 何 克 
服 这 些 困 难 解 决 好 存在 的 问题 以 更 好 地 推动 其 
发 展 ， 笔 者 有 以 下 一 些 思考 和 建议 。 

4.1 确立 大 规模 数字 化 原则 

美国 研究 图 书馆 协会 (ARL) 在 2010 年 6 
月 发 布 了 大 规模 数字 化 九 项 原则 中， 作为 其 成 
员 馆 在 对 特 藏 资源 进行 大 规模 数字 化 的 同时 , 也 
对 供应 商 或 者 出 版 社 进行 合作 方面 的 指导 ， 并 
敦促 他 们 使 用 这 些 原则 。 借 鉴 ARL 的 指导 原 
则 ,结合 上 述 大 规模 数字 化 的 现实 发 展 情况 ， 探 
讨 提出 我 国 图 书馆 在 进行 印 本 馆藏 大 规模 数字 
化 时 应 遵循 的 原则 。 

4.1.1 合理 使 用 原则 

合理 使 用 原则 是 著作 权 法 中 协调 著作 权 人 
和 使 用 者 之 间 利 益 的 一 项 制度 ， 是 对 知识 产权 
保护 与 公众 利益 的 一 种 折 中 体现 。 在 数字 化 时 
代 ， 知 识 产 权 的 环境 日 益 复 杂 化 ， 合 理 使 用 原 
则 的 利用 显得 更 为 重要 ， 但 由 于 人 为 的 主观 性 
影响 ， 要 准确 把 握 合 理 使 用 的 度 不 是 一 件 容 易 
的 事情 ， 图 书馆 在 遵循 这 一 原则 时 ， 一 定 要 明 
确 合理 使 用 的 使 用 对 象 和 目的 ， 从 而 在 为 公众 
提供 服务 的 同时 ， 最 大 限度 地 保护 著作 权 人 的 
利益 。 

4.1.2 一 次 性 (扫描 ) 原则 

为 了 保护 印 本 和 特 藏 资源 ， 特 别 是 那些 珍 
稀 资 源 ， 要 尽 可 能 遵循 一 次 性 扫描 原则 。 数 字 
化 扫描 对 印 本 资源 始终 都 有 不 同 程度 的 损害 ， 这 
需要 图 书馆 进行 周密 的 组 织 和 规划 ， 制 定 出 具 
有 前 瞻 性 的 扫描 计划 。 

4.1.3 保留 副本 及 更 新 原则 

图 书馆 应 得 到 从 其 馆藏 中 产生 的 所 有 数 

字 化 文件 的 副本 并 完整 保留 存储 ， 同 时 对 这 些 
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数字 化 内 容 进 行 定期 更 新 ， 在 版 权 法 允许 的 范 
围 内 向 相关 用 户 提供 这 些 副本 的 无 限制 本 地 访 
间 ， 并 行使 合理 使 用 的 权利 。 

4.1.4 共享 原则 

图 书馆 的 天 然 使 命 是 传承 和 传播 知识 和 文 
化 ， 在 开放 获取 的 大 背景 下 ， 共 享 已 演变 为 图 书 
馆 界 的 “ 普 世 ”价值 。 图 书馆 间 的 数字 馆藏 进行 共 
享 ， 能 避免 其 他 机 构 的 重复 投入 ， 从 而 避免 了 资 
源 、 资 金 和 人 力 的 浪费 ，HathiTrust 的 共享 数字 
仓储 项 目 就 是 这 一 原则 的 最 好 实践 。 而 共享 需要 
合作 的 手段 才能 实现 ， 这 将 在 下 面 进行 详 述 。 
4.2 立足 合理 使 用 原则 解决 版 权 问题 

版 权 问题 是 印 本 馆藏 大 规模 数字 化 进程 中 
所 面临 的 最 大 障碍 ， 图 书馆 需要 在 遵循 著作 权 
法 的 前 提 下 科学 、 合 理 的 使 用 “合理 使 用 ”原则 
才能 解决 好 版 权 问 题 。 

美国 作家 协会 曾 向 南 纽 约 地 区 法 院 起 诉 
HathiTrust 违反 了 美国 版 权 法 ，2012 年 10 月 法 
院 对 此 案 做 出 裁决 ， 判 定 HathiTrust 数字 图 书 
馆 对 印 本 资源 进行 扫描 和 数字 化 的 工作 事实 上 
属于 美国 版 权 法 规定 的 合理 使 用 。 这 是 合理 使 
用 和 美国 图 书馆 的 一 次 重大 胜利 中。 随后 ， 美 
国 作家 协会 又 向 美国 第 二 巡回 上 诉 法 院 提 起 上 
诉 ， 该 法 院 于 2014 年 6 月 做 出 驳回 上 诉 并 维持 
原 判 的 判决 号。 而 最 令 人 鼓舞 的 消息 是 该 上 诉 
法 庭 于 2015 年 10 月 宣判 ， 谷 歌 对 图 书 进 行 数 
字 化 扫描 的 行为 , 完全 合法 , 是 对 图 书 的 公平 、 正 
常 的 使 用 ， 对 社会 有 益 四。 这 一 判决 宣告 了 这 
一 长 达 10 年 诉讼 案 的 终结 ， 宣 告 了 谷歌 公司 的 
最 终 胜 利 ， 从 而 也 在 一 定 程度 上 扫 清 了 大 规模 
数字 化 的 障碍 。 

由 此 可 见 ， 合 理 使 用 这 一 指导 原则 在 解决 
版 权 问题 中 具有 极 大 的 指导 意义 和 现实 价值 。 
但 由 于 合理 使 用 对 著作 权 人 的 利益 在 客观 上 造 
成 了 一 定 程度 的 损害 ， 国 际 著作 权 法 对 合理 使 
用 有 着 严格 的 限制 和 判断 标准 ， 以 防止 合理 使 
用 的 过 度 使 用 和 滥用 。 

4.3 建立 多 级 多 维度 合作 框架 
合作 是 图 书馆 事业 通 向 成 功 之 路 的 法 宝 , 也 
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是 实现 资源 共享 向 纵深 发 展 的 必然 手段 。Google 
图 书馆 计划 和 HathiTrust 项 目 本 身 就 是 合作 的 产 
物 ，Google 和 HathiTrust 在 版 权 诉 讼 中 取得 的 
最 终 胜 利 与 美国 图 书馆 版 权 联 盟 发 挥 的 积极 作 
用 分 不 开 。 

由 OCLC、HathiTrust、 纽 约 大 学 Elmer 
Holmes Bobst 图 书馆 以 及 研究 型 馆藏 获取 和 保 
存 联盟 (ReCAP) 联合 实施 的 项 目 一 一 云图 书 
馆 计 划 (Cloud Library Project) 就 是 一 个 很 好 
的 实践 ， 这 一 项 目 得 到 安德鲁 梅 隆基 金 会 的 大 
力 资助 。 这 是 图 书馆 之 间 、 图 书馆 和 资助 者 之 
间 的 强 强 合作 ， 是 一 个 赋 有 前 上 脆性 和 可 持续 性 
发 展 的 项 目 ， 值 得 借鉴 和 推广 。 该 项 目 做 的 调 
研 显示 ， 截 至 到 2010 年 6 月 ， 美 国 研究 图 书 
馆 学 会 (ARL) 成 员 馆 馆藏 资源 有 30%《〈 中 位 
数 ) 与 HathiTrust 数字 图 书馆 重复 ; 纽约 大 学 
Bobst 图 书馆 的 馆藏 从 2009 年 9 月 到 2010 年 6 
月 期 间 与 ReCAP 和 HathiTrust 两 个 数字 仓储 都 
重复 的 数量 逐 月 上 升 ， 到 2010 年 6 月 重复 量 达 
到 约 20 万 种 中， 如 果 HathiTrust 能 提供 完善 的 
服务 ， 重 复 的 印 本 馆藏 可 以 从 该 馆 撤除 ， 立 竿 
见 影 的 受益 就 是 可 以 节约 不 少 空间 和 管理 成 本 。 
目前 HathiTrust 已 拥有 1 500 万 册 的 数字 馆藏 , 是 
2010 年 时 的 2.42 倍 ， 保 守 估 计 的 话 ，ARL 成 员 
馆 馆 藏 与 HathiTrust 重复 的 比率 已 达 60% (中 
位 数 ) 。 

云图 书馆 计划 的 目标 是 使 印 本 馆藏 在 大 规 
模 数字 化 环境 下 得 到 颇 为 高 效 的 管理 和 最 优化 
配置 和 整合 ， 从 而 促进 馆藏 建设 的 重新 定位 和 
图 书馆 的 服务 创新 。 尽 管 HathiTrust 的 数字 仓储 
已 拥有 1 500 万 册 图 书 ， 如 果 要 实现 全 面 的 印 本 
馆藏 的 云图 书馆 计划 ， 还 需要 与 其 他 大 型 服务 
机 构 进 行 合 作 ， 共 享 馆藏 资源 ， 如 美国 国会 图 
书馆 是 印 本 图 书 的 存储 机 构 ， 虽 然 美国 国会 图 
书馆 早 在 2011 年 就 已 是 HathiTrust 的 成 员 馆 , 但 
其 在 HathiTrust 里 的 数字 化 馆藏 只 有 10 万 余 
册 ， 如 果 HathiTrust 能 和 美国 国会 图 书馆 有 更 全 
面 深 入 的 合作 ， 至 少 可 以 覆盖 70% 以 上 的 数字 
化 图 书 资源 。HathiTrusth 和 美国 国会 图 书馆 都 


202310.03089v1 


chinaXiv 


知识 管理 论坛 


2017 年 第 5 期 (总 第 11 期 ) 


= 


ww.kmf.ac.cn 


长 


是 美国 数字 公共 图 书馆 的 重要 合作 伙伴 中， 三 
者 的 深入 合作 将 极 大 地 扩大 云图 书馆 计划 的 范 
围 和 影响 。 
HathiTrust 于 2016 年 正式 启 
计划 是 在 共享 数字 仓储 项 目 基础 上 更 深入 的 合 
作 与 共享 ， 其 目标 是 通过 印 本 及 其 数字 化 馆藏 
的 链接 来 确保 二 者 的 保存 ， 从 而 减少 成 员 馆 馆 
管理 的 费用 ， 同 时 促进 国家 乃至 洲际 馆藏 的 
共同 管理 和 共享 。 该 项 目 分 两 个 阶段 实施 ， 第 
一 阶段 在 2017 年 取得 实质 性 进展 : 在 第 一 阶段 
作为 保留 伙伴 加 入 该 计划 的 50 多 个 成 员 馆 需 在 
2017 年 4 月 底 以 前 确认 其 计划 保留 的 印 本 图 书 
B14。 共享 印 本 计划 不 仅 使 HathiTrust 里 数字 化 馆 
藏 的 印 本 资源 得 到 安全 保留 的 保障 ， 而 且 保 证 
了 成 员 馆 之 间 印 本 馆藏 的 长 期 可 借 性 ， 从 而 为 
云图 书馆 计划 的 最 终 实现 提供 更 为 可 靠 的 保障 。 
洲际 合作 也 日 益 盛 行 。 欧 洲 数字 图 书馆 和 
美国 数字 公共 图 书馆 宣布 合作 ， 任 何 用 户 将 可 
以 获得 两 个 系统 联合 的 丰富 馆藏 ， 合 作 的 内 容 
包括 : 可 互 操作 的 数字 模型 、 共 享 的 资源 规范 
以 及 合作 的 馆藏 建设 中 。 
印 本 馆藏 大 规模 数字 化 的 最 终 成 功 需要 研 
究 机 构 、 大 学 、 研 究 者 、 图 书馆 、 出 版 商 、 版 
权 所 有 者 及 资助 机 构 的 通力 合作 ， 建 立 一 种 所 


动 的 共享 印 本 


有 利益 方 都 接受 的 均衡 体制 ， 并 使 之 具有 可 持 
续 性 。 
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Research on the Mass Digitization of the Print Collection 


LiYongmei LiuLiu Liu Hong 
Sichuan University Library, Chengdu 610065 
Library of Sichuan College of Architectural Technology, Deyang 618000 
Abstract: [Purpose/significance] The mass digitization of the print collection is an inevitable action for 
digital libraries. It has enlarged the depth and breadth of library services, and has enormously promoted 
the development and progress of academic exchange and academic research. [Method/process] This paper 
analyzed the global mass digitization of the print collection in terms of the origin, environmental factors, 
development status and current problems. It took HathiTrust as a case study. [Result/conclusion] Building 
the principles, solving the copyright problems with fair use and establishing a multi-stage and multi-sided 
framework for cooperation are important measures to promote the full realization of the mass digitization. 
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